Dalla Word Sense Disambiguation alla Sintassi: il Problema dell'Articolo Partitivo in Italiano

نویسندگان

  • Ignazio Mauro Mirto
  • Emanuele Cipolla
چکیده

Italiano. Fuori contesto, un nesso come dei professori non dà certezza di dove collocare dei in relazione alle parti del discorso. Il nesso può per esempio valere o alcuni professori (per es. in Dei professori intervennero) o esprimere appartenenza (per es. i libri dei professori). Nel primo caso dei è l’articolo partitivo di un nesso nominale, nel secondo è la preposizione che introduce un complemento di specificazione. Questo caso di omonimia si può far rientrare nell’area del Word Sense Disambiguation, ma la sua rilevanza per la sintassi e per il NLP è evidente. Nonostante ciò, in letteratura di esso non abbiamo trovato tracce. Il lavoro distingue diverse funzioni dei membri della serie e propone un algoritmo per disambiguare i due usi riferiti e altri, per esempio i complementi retti (come in Approfittano dei tuoi fratelli) che rendono la disambiguazione ancora più complessa. English. Out of context, a phrase of Italian such as dei professori ’of.the teachers’ is ambiguous: it can either mean some teachers (e.g. Dei professori intervennero ’Some teachers attended’) or carry the value of a Saxon genitive (e.g. i libri dei professori ’the teachers’ books’). The part of speech to which dei belongs cannot be identified: dei could be a partitive article in a noun phrase or a preposition in a prepositional phrase. This key difference raises a problem in the area of Word Sense Disambiguation. Despite its relevance for NLP, to the best of our knowledge this case of homonymy has so far been disregarded in the literature. The paper distinguishes a number of functions dei carries and proposes an algorithm that can automatically discriminate between the two uses mentioned above, but also identify others that make the picture more complex.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Combining Distributional Semantic Models and Sense Distribution for Effective Italian Word Sense Disambiguation

English. Distributional semantics approaches have proven their ability to enhance the performance of overlap-based Word Sense Disambiguation algorithms. This paper shows the application of such a technique to the Italian language, by analysing the usage of two different Distributional Semantic Models built upon ItWaC and Wikipedia corpora, in conjunction with two different functions for leverag...

متن کامل

Assessing Sentiment Strength in Words Prior Polarities

Many approaches to sentiment analysis rely on lexica where words are tagged with their prior polarity i.e. if a word out of context evokes something positive or something negative. In particular, broad-coverage resources like SentiWordNet provide polarities for (almost) every word. Since words can have multiple senses, we address the problem of how to compute the prior polarity of a word starti...

متن کامل

Giuseppe Tomasi di Lampedusa: Storia e Tempo ne "Il Gattopardo"

La personalità di Giuseppe Tomasi di Lampedusa, così come la sua opera , sfuggono ad una convenzionale catalogazione. Erede di una antichissima famiglia dell'aristocrazia siciliana, sposato alla psicoanalista lettone Licy Wolff a sua volta discendente di un importante casato baltico,  raffinato conoscitore della letteratura inglese e francese, lo scrittore è di fatto un outsider  nel panorama s...

متن کامل

رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA

Word sense disambiguation is the task of identifying the correct sense for the word in a given context among a finite set of possible sense. In this paper a model for farsi word sense disambiguation is presented. The model use two group of features: first, all word and stop words around target word and topic models as second features. We extract topics from a farsi corpus with Latent Dirichlet ...

متن کامل

An Intelligence Platform based on OSINT tools and Open Source Technologies (in Italian)

In questo documento sono presentati i temi di maggior rilievo ed interesse riguardanti gli aspetti di progettazione e realizzazione di una Piattaforma di Business Intelligence. Ne è riportata l’intera esperienza di progetto dalla definizione degli obiettivi di business con la scelta di utilizzare componenti open source per mantenere il costo totale il più contenuto possibile, alla formalizzazio...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2017